Termout.org logo/LING


Update: February 24, 2023 The new version of Termout.org is now online, so this web site is now obsolete and will soon be dismantled.

Lista de candidatos sometidos a examen:
1) banco de datos (*)
(*) Términos presentes en el nuestro glosario de lingüística

1) Candidate: banco de datos


Is in goldstandard

1
paper corpusSignosTxtLongLines186 - : ^[39]2 Al Banco de Datos del Español se accede desde la página web de la Academia: [40]http://www .rae.es. Está dividido en dos grandes conjuntos documentales: el CREA (Corpus de Referencia del Español Actual), que contiene ejemplos de los últimos 25 años del idioma, y el CORDE (Corpus Diacrónico del Español), que abarca ejemplos desde los orígenes del español hasta el límite cronológico con el CREA. El criterio de clasificación de los textos en cada corpus varía: en el CREA la distribución de los textos se ha hecho por grandes áreas temáticas (hiper-campos); en cambio, en el CORDE la distribución de los textos es genérica. Este último corpus se divide en dos grandes grupos: 1) ficción, compuesto por textos en verso y prosa, a su vez subdivididos en lírica, épica y dramática¸ y 2) no ficción, donde aparece prosa estructurada en didáctica, científica, de sociedad, de prensa y publicidad, religiosa, histórico-documental y jurídica.

2
paper corpusSignosTxtLongLines405 - : Centrándonos en el caso de los corpus de gran magnitud, más específicamente, el caso de la lengua española, la Real Academia Española (RAE) pone a disposición de cualquier interesado en el estudio de nuestra lengua un recurso en línea, de acceso gratuito y fácil consulta: un banco de datos compuesto por cuatro conjuntos documentales bien diferenciados: el Corpus Diacrónico del Español (CORDE ), el Corpus de Referencia del Español Actual (CREA), el Corpus del Español del Siglo XXI (CORPES XXI) y el Corpus del Diccionario Histórico (CDH). Sin embargo, esta base de datos presenta algunas limitaciones relacionadas con su diseño, imputables a su gran extensión, selección de géneros textuales y unidad de muestra que afectan su representatividad. Lo que nos hace suponer que el análisis cuantitativo de la gran mayoría de los fenómenos lingüísticos que se estudien con ejemplos provenientes de este recurso pudieran presentar sesgos.

3
paper corpusSignosTxtLongLines405 - : 1 Este apartado se redactó a partir de la información proporcionada en el Manual de consulta del banco de datos del español que se encuentra disponible en <[32]http://corpus .rae.es/ayuda_c.htm>, en el que se explica la arquitectura y cómo se ha modelado este banco de datos. Hacemos esta aclaración, ya que a nuestro modo de ver podría ser incómodo citar repetidamente el mismo documento en sus diferentes apartados (que en realidad resulta muy breve y accesible), sin agregar más información relevante que el sitio en el que se pueden encontrar estas informaciones.

4
paper corpusSignosTxtLongLines513 - : Para ampliar el estudio del uso de estos neologismos, observamos si estas unidades se documentan en otras obras terminológicas y enciclopédicas, y también en corpus textuales y lexicográficos. Esto indicaría que, aunque estas unidades no se documentan en los diccionarios de referencia en catalán, se utilizan de forma más o menos frecuente y, por este motivo, se documentan en otras obras lexicográficas o en corpus. En relación con el primer grupo de fuentes, los neologismos se buscaron en el Cercaterm del Termcat, un banco de datos especializado, y en la Viquipèdia, una obra enciclopédica realizada de forma voluntaria y colaborativa . Si se documentan en estas dos obras, nos indica que los neologismos hacen referencia al conocimiento especializado y enciclopédico. En el segundo caso, los neologismos se buscaron en Google Académico, un corpus más restringido que Google. Finalmente, también se observó si se habían documentado en obras no actualizadas como el Corpus textual i informatitzat de la

Evaluando al candidato banco de datos:


1) corpus: 12 (*)
3) documentan: 4
5) textos: 4 (*)
6) neologismos: 4 (*)
10) crea: 3
11) corde: 3 (*)

banco de datos
Lengua: spa
Frec: 26
Docs: 13
Nombre propio: 1 / 26 = 3%
Coocurrencias con glosario: 4
Puntaje: 5.035 = (4 + (1+4.95419631038688) / (1+4.75488750216347)));
Candidato aceptado

Referencias bibliográficas encontradas sobre cada término

(Que existan referencias dedicadas a un término es también indicio de terminologicidad.)
banco de datos
: CORPES = Real Academia Española: Banco de datos (CORPES) Corpus del Español del Siglo XXI [en línea]. Disponible en: [250]http://web.frl.es/CORPES/